“维度灾难”:指当数据的维度(特征数)变高时,数据空间体积急剧增大,样本在空间中变得极其稀疏,导致许多算法(如最近邻、密度估计、搜索与优化、机器学习模型训练)需要成倍更多的数据才能保持同等效果,且距离度量、泛化能力等往往变差。
/ˈkɝːs əv dɪˌmɛnʃəˈnælɪti/
As the number of features grows, the model suffers from the curse of dimensionality.
随着特征数量增加,模型会受到维度灾难的影响。
Even with thousands of samples, nearest-neighbor methods can break down under the curse of dimensionality because distances become less informative in high-dimensional spaces.
即使有成千上万的样本,在高维空间里最近邻方法也可能因维度灾难而失效,因为距离变得不再那么“有信息量”。
该术语常归功于数学家与计算机科学家 Richard E. Bellman(理查德·贝尔曼),他在研究动态规划与高维问题时指出:维度一旦升高,计算与数据需求会呈“灾难性”膨胀,因此用 curse(诅咒/灾难)形象描述这种难以避免的代价;dimensionality 来自 dimension(维度)加后缀 -ality(性质/状态)。